我们开发了一种新的方法来漂移游戏,一类两人游戏,其中包括许多应用程序来增强和在线学习设置,包括使用专家建议和对冲游戏的预测。我们的方法涉及(a)通过求解相关的部分微分方程(PDE)来猜测渐近的最佳潜力;然后(b)通过证明最终时间损失的上限和下限来证明猜测的合理性,它们的差异像个时间步数的负能力一样。我们潜在的基于上限的证据是基本的,只需使用泰勒的扩展。我们潜在的基于潜在的下限的证明也相当基本,将泰勒的扩展与概率或组合论证相结合。先前关于渐近最佳策略的大多数工作都使用了通过解决离散动态编程原理获得的潜力。这些论点因其离散性而变得复杂。我们使用的潜力是PDE的明确解决方案,这使我们的方法促进了我们的方法。这些论点基于基本的演算。我们的方法不仅更基本,而且还提供了新的电位,并得出相应的上和下限,这些上限和下限在渐近方面相互匹配。
translated by 谷歌翻译